
أصدرت Openai نموذجين جديد للذكاء الاصطناعي (AI) يوم الأربعاء. هذه هي أحدث النماذج التي تركز على التفكير في O3 و O4-MINI ، وهي أحدث نماذج تركز على الشركة مع سلسلة مرئية مرئية (COT). ذكرت شركة الذكاء الاصطناعى مقرها في سان فرانسيسكو أن هذه النماذج تأتي مع إمكانية التفكير البصري ، مما يعني أنه يمكنهم تحليل و “التفكير” في صورة للإجابة على استعلامات المستخدم الأكثر تعقيدًا. خليفة لـ O1 و O3-MINI ، ستكون هذه النماذج متاحة حاليًا للمشتركين المدفوعين في ChatGPT. والجدير بالذكر أن الشركة أصدرت أيضًا سلسلة GPT-4.1 من نماذج الذكاء الاصطناعي في وقت سابق من هذا الأسبوع.
تصل نماذج التفكير الجديدة من Openai مع تحسين الأداء
في بريد على X (المعروف سابقًا باسم Twitter) ، أعلن المقبض الرسمي لـ Openai عن إصدار نماذج اللغة الكبيرة الجديدة (LLMS). وصفتهم بأنها “أذكى النماذج الأذكية والأكثر قدرة” ، أوضحت شركة الذكاء الاصطناعى أن هذه النماذج تأتي الآن مع إمكانية التفكير البصري.
يعني التفكير البصري بشكل أساسي أن نماذج الذكاء الاصطناعى يمكن أن تحلل الصور بشكل أفضل لاستخراج المعلومات السياقية والضمنية منها أيضًا. على ذلك موقع إلكتروني، قال Openai إن هذه النماذج الأولى من الشركة التي يمكنها استخدام كل أداة ودمجها في كل أداة داخل ChatGPT. وتشمل هذه البحث على الويب ، والبيثون ، وتحليل الصور ، وتفسير الملفات ، وتوليد الصور.
هذا يعني أن نماذج O3 و O4-MINI AI يمكن أن تبحث عن الصورة على الويب ، ومعالجة الصورة عن طريق التكبير ، والاقتصاص ، والتقليب ، وتحسينها ، وحتى تشغيل رمز Python لاستخراج المعلومات. قال Openai إن هذا سيسمح للنماذج بالعثور على المعلومات حتى من الصور غير الكاملة.
تتضمن بعض المهام التي يمكن أن تؤديها هذه النماذج الآن قراءة الكتابة اليدوية من دفتر ملاحظات رأسًا على عقب ، وقراءة علامة بعيدة مع نص بالكاد يمكن القراءة ، والتعرف على سؤال معين من قائمة كبيرة ، وإيجاد جدول حافلة من صورة الحافلة ، وحل اللغز ، والمزيد.
عند الوصول إلى الأداء ، ادعى Openai أن نماذج O3 و O4-Mini AI تتفوق على نماذج GPT-4O و O1 على معايير MMMU و Mathvista و VLMs أعمى ، وكروكسيف. لم تشارك الشركة أي مقارنات في الأداء مع نماذج الذكاء الاصطناعى الطرف الثالث.
أبرز Openai أيضًا عدة قيود على هذه النماذج. يمكن أن تؤدي نماذج الذكاء الاصطناعى خطوات معالجة الصور غير الضرورية ودعوات الأدوات للتسبب في سلاسل تفكير طويلة بشكل مفرط. تعد O3 و O4-MINI عرضة أيضًا لأخطاء الإدراك ، ويمكنهما إساءة تفسير المعلومات المرئية لإعطاء ردود غير صحيحة. علاوة على ذلك ، أبرزت شركة الذكاء الاصطناعي أن النماذج قد تعاني أيضًا من مشكلات متعلقة بالموثوقية.
يتم توفير كل من طرازات O3 و O4-Mini AI لمستخدمي ChatGpt Plus و Pro و Team. سيحلون محل النماذج O1 و O3-Mini و O3-Mini عالية في محدد النموذج. سيتمكن مستخدمو Enterprise و EDU من الوصول إليهم الأسبوع المقبل. يمكن للمطورين الوصول إلى النماذج عبر إكمال الدردشة والاستجابات واجهات برمجة التطبيقات (APIs).